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Beschreibung 

Die vorliegende Erfindung betrifft Myc-bindende Zinkfinger-Proteine. ihre Herstellung und ihre Verwendung. 

Myc ist ein speztf isch an DNA bindendes Protein. Es wird zur Familie d^ Helix-Loop-Helix/Leucin-Zipper (HLH^Z) 
5 Transkriptionsfakloren gezahit (Landschulz et al. 1988. Murre et al.. 1989). Myc ist ein zentraler Transkriptionsaktivator. 
der mit dem Protein Max (Amati et al.. 1 993) einen Komplex bikJet und durch diesen nwlekularen Mechanismus andere 
Gene akliviert. beispielsweise alpha-Prothymosingen. Ornithindecarboxylasegen und cdc25A. 

Von Schuiz et al. 1995, wurde ein 13 Zinkfinger enthaltendes Protein aus der Maus beschrieben. dessen zelluiare 
Funktion jedoch unWar ist 

10 Aufgrund seiner SchlOsselstellung in der Transkription bietet Myc einen Ansatzpunkl zum Verstandnis von zelluia- 
ren, insbesondere von pathophysiologischen Prozessen. 

Es bestand daher die Aufgabe, weitere Informationen uber die molekulare Wirkungsweise von Myc. insbesondere 
Ober die Myc vermittette Genrepression bereiUustellen. _ 
Gegensland der Erfindung ist ein Protein mit der in SEQ ID N02 dargestellten Aminosauresequenz. Dieses Pro- 

15 tein besttzt dreizehn Zinkf ingerdonnanen. 

Es weist fblgende biologischen Eigenschaften auf : 

• Spezrfische Bindung an Myc, 

• Transaktivierung des Adenovirus Major Late (AdML) Promotors, 
20 • Transaktivierung des Cyclin D1 Promotors, 

• durch Assoziation mit Myc wird die Transaktivierung gehemmt, 

in Abwesenheit von Myc ist das Protein im wesentlichen Im Cytosol assoziiert mit Mikrotubuli zu f inden. 

Ein weiterer Qegenstand der Erfindung sind Proteine, die sich aus der SEQ ID N02 dargestellten Struktur durch 
25 SdJStitution, Insertion oder Deletion von einem Oder mehreren Aminosauren aWeiten lessen, wobei diese Proteine 
noch die wesentlichen biologischen Eigenschaften des durch SEQ ID N02 beschriebenen Proteins besitzen. Diese 
Proteine weiden im folgenden Muteine genannt Unter wesentlichen Eigenschaften wird die spezif ische Bindung der 

Muteine an Myc verstanden. . ^ . „ u • 

Die oben aufgefOhrten Eigenschaften des durch SEQ ID N0:2 beschriebenen Proteins mOssen nicht alle bei den 
30 Muteinen vorhanden sein. solange die spezif ische Bindung an Myc gegeben ist. Bevofzugt sind jedoch diejenigen Mut- 
eine. die alle der oben aufgefOhrten Eigenschaften besitzen. 

Die Anzahl der durch Insertion Substitution oder Deletion gegenOber dem durch SEQ ID N0:2 beschriebenen Pro- 
tein veranderten Aminosauren kann zwischen 1 und 100, bevorzugt zwischen 1 und 50 Aminosauren vanieren. Die Ver- 
anderungen kOnnen In einem Weineren Bereich des MolekQIs konzentriert oder auch Ober das ganze MolekQl verteilt 

35 sein. . ^ . ^ A-,- 

Bevorzugte Veranderungen sind konservative Substitutionen. bei denen eine Anwnosaure durch eine andere Ami- 

nosaure ttH ahnlicher RaumerfOllung. Ladung oder Hydrophilie ersetzt wird 
Be^iele fOr solche konservativen SiA)Stitutionen sind 

40 Ersatz von Arg durch Lys oder umgekehrt, 

Ersatz von Arg durch His oder umgekehrt. 

Ersatz von Asp durch Qlu oder umgekehrt 

Ersatz von Asn durch Qln oder umgekehrt 

Ersatz von Cys durch Met oder umgekehrt 
45 Ersatz von Cys durch Ser oder umgekehrt 

Ersatz von Gly durch Ala oder umgekehrt. 

Ersatz von Val durch Leu oder umgekehrt 

Ersatz von Val durch He oder umgekehrt 

Ersatz von Leu durch He Oder umgekehrt 
so Ersatz von Phe durch Tyr oder umgekehrt, 

Ersatz von Phe durch Trp oder umgekehrt, 

Ersatz von Ser durch Thr oder umgekehrt. 

Die Veranderungen kOnnen auch kombiniert warden. z.B. eine oder mehrere Sii>5titutionen mit Deletionen 

55 und/oder Inserttonen. « 

Ein weiterer Gegenstand der Erfindung sind NuWeinsauresequenzen, die fOr die oben beschnebenen Proteine 
codieren. Solche NuWeinsauresequenzen sind bevorzugt DNA, insbesondere cDNA Sequenzen. in einzelstrangiger 
Oder doppelstrangiger Fonii. 



2 



EP0 875 567A2 



Bevorzugte Nddeinsauresequenzen sind solche mit der in SEQ ID N0:1 dargestellten Sequenz und solche, die mit 
dieser Sequenz einen hohen Venwandschaftsgrad aufweisen, beispwelsweise solche, die fOr das gleiche Protein codie- 
ren wie SEQ ID N0:1. Weitere bevorzugte Nukleinsfluresequenzen sind solche. cfie fOr ein Protein codieren, das 95% 
Oder mehr Identitat mit dem Protein der Sequenz SEQ ID N0:2 aufweist 

5 Ein weiterer Gegensland der Erfindung sind Vektoren. die eine der oben beschriebenen NuWeinsauresequ^en 
in funktioneller VerknQpfung mit einem oder mehreren Regulationselementen tragen. Unter Regulationselemente sind 
NuWeinsaurefragmente zu verstehen. die auf Transkription oder Translation einen regulierenden EinfluS haben. bei- 
spielsweise Promotoren. Enhancer, Polyadenylierungsstellen, ribosomale Bindungsstellen. 

Die mit solchen Vektoren transformierten Wirtsorganismen sind ebenfalls Gegenstand der Erfindung. Als Wirtsor- 

10 ganismen geeignet sind Mikroorganismen. pf lanzliche oder tierische Zellen oder Lebewesen. Bevorzugte Wirtsorganis- 
men sind eukaryontische Zellen und Lebewesen. Der Begriff Wirtsorganismus umfaBt auch beispielsweise transgene 
Tiere und Pflanzen. 

Die Herstellung der erfindungsgemSBen Protelne erfolgt bevorzugt mit Hilfe gentechnischer Verfahren. Em Wirts- 
organismus. der die Erbinfbrmation fur die eif indungsgemaBen Proteine trfigt, wird unter Bedingungen kuttiviert die die 
15 Expression des Proteins eriauben. Diese Bedingungen -wie Temperatur. Nahrmedium, Zelldichte - hangen weitgehend 
von der Wahl des Wirtsorganismus ab. Solche Bedingungen sind jedoch dem Fachmann fOr die einzelnen Wirtsorga- 
nismen geiaufig. 

Die exprimierten Proteine werden anschlieBend. ggf. nach Aufbrechen des Wirtsorganismus. vom Wirtsorganis- 
mus abgetrennt und in reiner Form durch bekannte Methoden der Proteinreinigung. wie Failung, Chromatographie, 
20 Elektrophorese in reiner Form isoliert. Ein weiterer Gegenstand der Erfindung 1st die Venwendung der Proteine als Anti- 
gen zur Herstellung von AntikOrpern, sowie die so erhaltenen AntikOrper. Es lessen sich durch dem Fachmann 
bekannte Verfahren polyWonale Antiseren oder auch monoWonale AntikOrper herstellen. 

Die erfindungsgemaBen Proteine eignen sich auch als Teslsysteme zur Auffindung von potentiellen selektiven 
Transkripttonsmodulierenden Substanzen. Dies laBt sich besonders gut testen, indem man die Fahigkeit der Proteine. 
25 mit Myc einen Proleinkonplex zu biiden. ausnOtzt. Ein weiterer Gegenstand der Erfindung ist daher ein Verfahren zur 
Woitifizlerung von spezifischen transkriptionsmodulierenden Substanzen, das fblgende Schritte umfaBt: 

(a) Inkubation des Proteins gemaB Anspruch 1 mit dem GenproduW von myc unter Bedingungen. unter denen sich 
ein Proteinkomplex zwischen diesen beiden Proteinen ausbildet. 
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(b) Inkubation der beiden Proteine unter ansonst gleichen Bedingungen wie (a) jedoch in Anwesenheit einer oder 
mehrerer Substanzen. die auf spezifteche transkriptionsnxxJulierende Akllvitaten zu testen sind. 

(c) Ermittein des Unterschiedes in der Proteinkomplexbildung zwischen (b) und (a), 

(d) Auswahl solcher Sdbstanzwi. bei denen gemafl Schritt (b) eine andere Proteinkomplexbildung ertialten wurde 
ais bei Schritt (a). 

Es lessen sfch damH Substanzen auff inden. die die Proteinkomplexbildung zwischen den neuen Zinkfingaprotein 
40 und Myc fdrdem.aber auch solche, die sieunterbinden. 

Die erfindungsgemaBen NuWeinsauresequenzen eignen sich auch zur Gentherapie von Erironkungen, bei denen 
die durch Myc vennitlelte Transkription gestOrt IsL ^ -r i. 

Beispielsweise kOnnen zusaizliche Gensequenzen eingebracht werden um so die zelluiare Kbnzentration der Zink- 
fingerproteine zu erhOhen. Es kann aber auch gewQnscht sein, daB die l^entration der Zinkfingerproteine erniedrigt 
45 werden soil. In diesem Falle bietel sich eine Gentherapie auf antisense Basis an, woba man eine zu dem Zinkfinger- 
proleingen konplementare NuWeinsaure Oder NuWeinsaurederivat appliziert, und somit die Expression des Zinkf inger- 

proteingens reduziert 

Die weitere AusgestaKung der Erfindung ist in den folgenden Beispielen aufgefOhri 

50 Beispiel 1 

Isolieaing der DN A mit der durch SEQ ID N0:1 beschriebenen Struklur 

Vorausgegangene Aibeiten hatlen gezeigt daB die Integritat der Helix-Loop-Helix Domane von Myc kritisch fOr die 
55 Genrepression durch Myc in stabilen Zeilinien war (Philipp et al.. 1994). Um neue Proteine zu Wentifizieren, die mit dem 
C-Terminus von Myc inteiagieren. wurde ein DNA-Fragmert. das fOr die basische Region und die HLH/LZ Domane 
(Aminosauren 355-439 des humanen Myc) codiert. Im Leserahmen an die DNA bindende Domane von GAL4 ( Amino- 
saure M47) fusioniert und als KOder in einem "Two-Hybrid-Screen" (ReWs and Song, 1989) benutzt 
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2x10^ unabhangige Transformanden einer HeLa cDNA BiWiothek. markiert mit der GAL4 Aktivierungsdomane. 
wurden gescreent Ein Qon rrat p-Qalaktosidaseaklivitat wurde weiter charakterfeiert Es wurde keine Interaktion zwi- 
schen dem von diesem Qon codierten Protein und der DMA Bindungsdomane von QAL4 allein oder einer GAU-BCY- 
1 Chimare. die als Negativkontrolle benutzt wurde. festgestelH 
5 Die Interaktion mit Myc wurde aufgehoben durch Deletion der HLH-Domane in Myc (370-412). nicht aber durch 
Insertton der vier Aminosauren zwischen der HLH Domane und dem Leudn-Zipper (In 412) oder durch Deletion des 
gesamten Leudn-Zippers (412-434). Eine spezifische Interaktion wurde audi nachgewiesen mit N-Myc aber keine mit 
MAX Oder USF. zwei HLH-Proleinen. die mit Myc nahe venwandt sind. 

cDNA-MoIekOle mit voller Lange wurden durch ein 5'-RACE-Protokoll isoliert und sequenziert (SEQ ID N0:1). Sie 
10 codieren ein Protein mrt 803 Aminosauren (SEQ ID N0:2) mit einem theoretischen Mdekulargewicht von 87.970 Dal- 
ton. Das Protein wurde Miz-I fOr Myc-Interacting-Zincfinger-Protein-1 genannt 

Die Sequenzierung ergab, daS der isolierte Clon fOr ein Zinkfingerprotein mit 13 Zinkfingern codierte. 12 davon 
unmittetoar gedustert in der C-terminalen Haifte des Proteins. 

15 Beisplel 2 

Herstellung von Muteinen 

Ausgehend von der In SEQ ID N0:1 dargestellten NuWeinsauresequenz kOnnen mit dem Fiachmann geiaufigen 
20 Methoden der Gentechnik NuWeinsauren hergestellt werden. die fOr veranderte Proteine (Mut^ne) codieren. Die Her- 
stellung der Mutelne selbst erfolgt zweckmaBigenweise durch E)(pression einer NuWeinsaure in einem geeigneten 
Wirlsorganisnfujs. 

Beispiel 3 

25 

Assoziation des Proteins SEQ ID N02 mit Myc 

Der C-Terminus des Proteins SEQ ID N0.-2 (Aminosaure 2B9-80Z) wurde mit der GIutathion-Transferase (GST) 
(Smith and Johnson. 1988) fusioniert das GST-Miz-1 Fusionsprotein gereinigt und mit in vitro synthetisiertem. radioak- 
30 tiv markiertem Myc Protein inkubiert. Myc assoziiert spezifisch mit QST-Miz-1 , jedoch nicht mit GST. Eine Mutante von 
Myc. der die HLH Domane fehlt. konnte nicht mit GST-Miz-1 assoziieren. Radioaktiv marWertes Max interagiert weder 
mit GST-Miz-1 noch mit GST Jedoch kann mit Hllfe von Myc Max an GST-Miz-1 -KOgelchen in vitro binden. was dafOr 
sprlcht daB Miz-1 und Max mit unterschiedlichen Fiachen der HLH-Domane von Myc interagieren. 
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SEQUENZ PROTOKOLL 

(1) ALGEMEINE INFORMATION: 

(i) ANMELDER: 

(A) NAME: BASF Aktiengesellschaf t 

(B) STRASSE: Carl-Bosch-Strasse 38 

(C) ORT: Ludwigshafen 

(E) LAND: BundesrepubllJc Deutschland 

(F) POSTLEITZAHL: D-67056 

(G) TELEPHON: 0621/6048526 

(H) TELEFAX: 0621/6043123 

(I) TELEX: 1762175170 

(ii) ANMELDETITEL: Myc-bindende Zinkf ingerproteine 

(ill) ANZAHL DER SEQUENZEN: 2 

(iv) COMPUTER-LESBARE FORM: 

I A) DATENTRAGER: Floppy disk 

(B) COMPUTER: IBM PC coinpatible 

(C) BETRIEBSSYSTEM: PC-DOS/MS-DOS 

(D) SOFTWARE: Patentin Release #1.0, Version #1.25 (EPA) 

(2) INFORMATION ZO SEQ ID NO: 1: 

(i) SEQUENZ CHARAKTERISTIKA: 

(A) LiNGE: 2680 Basenpaare 

(B) ART: Nukleinsiure 

(C) STRANGFORM: Einzel 

(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOLS: cDNS zu mRNS 
(ili) HYPOTHETISCH: NEIN 
(iii) ANTISENSE: NEIN 

(Ix) MERKMALE: 

(A) NAME/SCHLtJSSEL: 5'UTR 

(B) LAGE: 1..159 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: CDS 

(B) LAGE: 160.«2571 

(ix) MERKMALE: 

(A) NAME/SCHLOSSEL: 3'UTR 

(B) LAGE: 2572.. 2680 

(Xi) SEQUENZBESCHREIBUNG: SEQ ID NO: 1: 
GGAGTGCCGT CCCCGGCCTT CTCGCGGCCG TGATGCACCT CCCTCTGCGG TGGGGTCCGG 
GACATGGCAG GTAATGAGCC GGACGAGGGG AGCCAAGCTG GAGTTTACAC AGGCAAACTG 
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IS 



TCAGAAAAGA GTAGCCTGGG CTGTCTGGAA ATCTGAGCC ATG GAC TTT CCC CAG 174 

Met Asp Pbe Fro Gin 
1 5 

CAC AGC CAG CAT GTC TTG GAA CAG CTG AAC CAG CAG CGG CAG CTG 6GG 222 
His Ser Gin His Val Leu Glu Gin Leu Asn Gin Gin Aig Gin Leu Gly 

10 15 20 

CTT CTC TGT GAC TGC ACC TTT GTG GTG GAC GGT GTT CAC TTT AAG GCT 270 
Leu Leu Cys Asp Cys Thr Phe Val Val Asp Gly val His Phe Lys Ala 

25 30 35 

CAT AAA GCA GTG CTG GCG GCC TGC AGC GAG TAC TTC AAG ATG CTC TTC 318 
His Lys Ala val Leu Ala Ala Cys Ser Glu Tyr Phe Lys Met Leu Pbe 
40 45 50 

GTG GAC CAG AAG GAC GTG GTG CAC CTG GAC ATC AGT AAC GCG GCA GGC 366 
val Asp Gin Lys Asp Val Val His Leu Asp lie Ser Asn Ala Ala Gly 
55 60 65 

CTG GGG CAG ATG CTG GAG TTT ATG TAC ACQ GCC AAG CTG AGC CTG AGC 414 
Leu Gly Gin Met Leu Glu Phe Met Tyr Thr Ala Lys Leu Ser Leu Ser 
70 75 80 85 

^ CCT GAG AAC GTG GAT GAT GTG CTG GCC GTG GCC ACT TTC CTC CAA ATG 462 

Pro Glu Asn val Asp Asp Val Leu Ala Val Ala Thr Phe Leu Gin Met 

90 95 100 

CAG GAC ATC ATC ACG GCC TGC CAT GCC CTC AAG TCA CTT GCT GAG CCG 510 
^° Gin Asp lie He Thr Ala Cys His Ala Leu Lys Ser Leu Ala Glu Pro 

105 110 1" 

GCT ACC AGC CCT GGG GGA AAT GCG GAG GCC TTG GCC ACA GAA GGA GGG 558 
Ala Thr Ser Pro Gly Gly Asn Ala Glu Ala Leu Ala Thr Glu Gly Gly 
35 120 125 130 

GAC AAG AGA GCC AAA GAG GAG AAG GTG GCC ACC AGC ACG CTG AGC AGG " 606 

ASP Lys Arg Ala Lys Glu Glu Lys Val Ala Thr Ser Thr Leu Ser Arg 
135 140 145 



10 



40 



4S 



SO 



55 



CTG GAG 


CAG 


GCA 


GGA CGC AGC 


ACA 


CCC 


ATA 


GGC CCC AGC AGG 


GAC 


CTC 


Leu Glu 


Gin 


Ala 


Gly Arg Ser 


Thr 


Pro 


lie 


Gly Pro Ser Arg 


Asp 


Leu 


150 






155 








160 




165 


AAG GAG 


GAG 


CGC 


GGC GGT CAG 


GCC 


CAG 


AGT 


GCG GCC AGC GGT 


GCA 


GAG 


Lys Glu Glu 


hxg 


Gly Gly Gin 


Ala 


Gin 


Ser 


Ala Ala Ser Gly 


Ala 


Glu 








170 






175 




180 




CAG ACA 


GAG 


AAA 


GCC GAT GCG 


CCC 


CGG 


GAG 


CCG CCG CCT GTG 


GAG 


CTC 


Gin Thr 


Glu 


Lys 


Ala Asp Ala 


Pro 


Arg 


Glu 


Pro Pro Pro Val 


Glu 


Leu 




185 






190 




195 







654 



702 



750 
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60 



AAG CCA GAC 
Lys Pro Asp 
200 

TTG TCC GAG 
Leu Ser Glu 
215 

GGG GAA GAG 
Gly Glu Glu 
230 

GGG CCA GCT 

Gly Pro Ala 



GCC CCC GAG 
Ala pro Glu 



CAG GAG CTC 
Gin Glu Leu 
280 

GAC CGC ACG 
Asp Arg Thr 
295 

GAC TGT GGG 

Asp Cys Gly 

310 

CGC ATC CAC 
Arg He His 

GCC TTT TCC 

Ala Phe Ser 



CCC ACG AGT GGC ATG GCT GCC GCA GAA GCT GAG GCC GCT 
pro Thr Ser Gly Met Ala Ala Ala Glu Ala Glu Ala Ala 

205 210 

AGC TCG GAG CAA GAA ATG GAG GTG GAG CCC GCC CGG AAA 
Ser ser Glu Gin Glu Met Glu Val Glu Pro Ala Arg Lys 

220 225 



798 



CCT CTG AAG 

Pro Leu Lys 
360 

ATC AGC CTG 

He Ser Leu 
375 

TAG CGC TGC 
Tyr Arg Cys 
390 



GAG CAA AAG GAG CAA 
Glu Gin Lys Glu Gin 
235 

GAG GTC AAG GAG GAG 
Glu Val Lys Glu Glu 
250 

GAG AAC GAG AAT GAG 
Glu Asn Glu Asn Glu 
265 

GGC TCC GAG GCC CGG 
Gly Ser Glu Ala Arg 

285 

GAG TCC AAG GCC TAC 
Glu Ser Lys Ala Tyr 

300 

AAG GAG TTC ACG CAC 

Lys Glu Phe Thr His 
315 

ACG GGG GAG AAG CCC 

Thr Gly Glu Lys Pro 
330 

GAC CCG GCC GCG TGC 

ASP pro Ala Ala Cys 
345 

CCC TAC GGC TGC GAG 
Pro Tyr Gly Cys Glu 

365 



GAG GAG CAA GAG GAG GAG GGC GCA 
Glu Glu Gin Glu Glu Glu Gly Ala 
240 245 

GGT TCC CAG CTG GAG AAC GGA GAG 
Gly Ser Gin Leu Glu Asn Gly Glu 
255 260 

GAG TCA GCG GGC ACA GAC TCG GGG 
Glu Ser Ala Gly Thr Asp Ser Gly 
270 275 

GGC CTG CGC TCA GGC ACC TAC GGC 

Gly Leu Arg Ser Gly Thr Tyr Gly 

290 

GGC TCC GTC ATC CAC AAG TGC GAG 

Gly Ser val He His Lys Cys Glu 

305 

ACG GGG AAC TTC AAG CGG CAC ATC 

Thr Gly Asn Phe Lys Arg His He 
320 325 

TTC TCG TGC CGG GAG TGC AGC AAG 

Phe Ser Cys Arg Glu Cys Ser Lys 
335 340 

AAG GCC CAT GAG AAG ACG CAC AGC 

Lys Ala His Glu Lys Thr His Ser 
350 355 

GAG TGC GGG AAG AGC TAC CGC CTC 
Glu Cys Gly Lys Ser Tyr Arg Leu 

370 



CTG AAC CTG CAC AAG AAG CGG CAC TCG GGC GAG GCG CGC 
Leu Asn Leu His Lys Lys Arg His Ser Gly Glu Ala Arg 

380 385 

GAG GAC TGC GGC AAG CTC TTC ACC ACC TCG GGC AAC CTC 

Glu ASP cys Gly Lys Leu Phe Thr Thr Ser Gly Asn Leu 
395 400 "5 
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942 



990 



1038 
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1182 



1230 
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AAG CGC CAC CAG CTG GTG CAC AGC GGC GAG AA6 CCC TAG GAG TGC GAG 1422 
Lys Arg His Gin Leu Val His Ser Gly Glu Lys Pro Tyr Gin Cys Asp 

410 415 420 

TAG TGC GGC CGC TCC TTC TCC GAG CCC ACT TCC AAG ATG CGC CAC CTG 1470 
Tyr Cys Gly Arg Ser Phe Ser Asp Pro Thr Ser Lys Met Arg His Leu 

425 430 435 

GAG ACC CAC GAC ACG GAC AAG GAG CAC AAG TGC CCA CAC TGC GAC AAG 1518 
Glu Thr His Asp Thr Asp Lys Glu His Lys Cys Pro His Cys Asp Lys 
440 445 450 

' AAG TTC AAC CAG GTA GGG AAC CTG AAG GCC CAC CTG AAG ATC CAC ATC 1566 
Lys Phe Asn Gin Val Gly Asn Leu Lys Ala His Leu Lys He His He 
455 460 465 

GCT GAC GGG CCC CTC AAG TGC CGA GAG TGT GGG AAG CAG TTC ACC ACC 1614 
Ala Asp Gly Pro Leu Lys Cys Arg Glu Cys Gly Lys Gin Phe Thr Thr 
20 470 475 480 485 

TCA GGG AAC CTG AAG CGG CAA CTT CGG ATC CAC AGC GGG GAG AAG CCC 1662 
ser Gly Asn Leu Lys Arg Gin Leu Arg He His Ser Gly Glu Lys Pro 

490 495 500 

TAG GTG TGC ATC CAC TGC CAG CGA CAG TTT GCA GAC CCC GGC GCT CTG 1710 
Tyr Val Cys He His Cys Gin Arg Gin Phe Ala Asp Pro Gly Ala Leu 

505 510 515 

CAG CGG CAC GTC CGC ATT CAC ACA GGT GAG AAG CCA TGC CAG TGT GTG 1758 
Gin Arg His Val Arg He His Thr Gly Glu Lys Pro Cys Gin Cys Val 
520 525 530 

ATG TGC GGT AAG GCC TTC ACC CAG GCC AGC TCC CTC ATC GCC CAC GTG 1806 
Met Cys Gly Lys Ala Phe Thr Gin Ala Ser Ser Leu He Ala His Val 
535 540 545 

CGC CAG CAC ACC GGG GAG AAG CCC TAG GTC TGC GAG CGC TGC GGC AAG 1854 

Arg Gin His Thr Gly Glu Lys Pro Tyr Val Cys Glu Arg Cys Gly Lys 
550 555 560 565 

AGA TTC GTC CAG TCC AGC CAG TTG GCC AAT CAT ATT CGC CAC CAC GAC 1902 
Arg Phe Val Gin Ser Ser Gin Leu Ala Asn His He Arg His His Asp 

570 575 580 

^ AAC ATC CGC CCA CAC AAG TGC AGC GTG TGC AGC AAG GCC TTC GTG AAC 1950 

Asn He Arg Pro His Lys Cys Ser Val Cys Ser Lys Ala Phe val Asn 

585 590 595 

GTG GGG GAC CTG TCC AAG CAC ATC ATC ATT CAC ACT GGA GAG AAG GCT 1998 
val Gly Asp Leu Ser Lys His He He He His Thr Gly Glu Lys Pro 
600 605 610 
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TAC CTG TGT GAT AAG TGT GGG CGT GGC TTC AAC CGG GTA GAC AAC CTG 
Tyr Leu Cys Asp Lys Cys Gly Arg Gly Phe Asn Arg Val Asp Asn Leu 
615 620 625 

CGC TCC CAC 6TG AAG ACC GTG CAC CAG GGC AAG GCA GGC ATC AAG ATC 
Arg Ser His Val Lys Thr Val His Gin Gly Lys Ala Gly He Lys He 
630 635 640 645 

CTG GAG CCC GAG GAG GGC AGT GAG GTC AGC GTG GTC ACT GTG GAT GAC 

Leu Glu Pro Glu Glu Gly Ser Glu Val Ser Val Val Thr Val Asp Asp 

650 655 660 

ATG GTC ACG CTG GCT ACC GAG GCA CTG GCA GCG ACA GCC GTC ACT CAG 
Met val Thr Leu Ala Thr Glu Ala Leu Ala Ala Thr Ala Val Thr Gin 

665 670 675 

CTC ACA GTG GTG CCG GTG GGA GCT GCA GTG ACA GCC GAT GAG ACG GAA 
Leu Thr val Val Pro Val Gly Ala Ala Val Thr Ala Asp Glu Thr Glu 
680 685 690 

GTC CTG AAG GCC GAG ATC AGC AAA GCT GTG AAG CAA GTG CAG GAA GAA 
val Leu Lys Ala Glu He Ser Lys Ala Val Lys Gin Val Gin Glu Glu 
695 700 705 

GAC CCC AAC ACT CAC ATC CTC TAC GCC TGT GAC TCC TGT GGG GAC AAG 
ASP Pro Asn Thr His He Leu Tyr Ala Cys Asp Ser Cys Gly Asp Lys 
710 715 720 725 

TTT CTG GAT GCC AAC AGC CTG GCT CAG CAT GTG CGA ATC CAC ACA GCC 
Phe Leu ASP Ala Asn Ser Leu Ala Gin His val Arg lie His Thr Ala 

730 735 740 

CAG GCA CTG GTC ATC TTC CAG ACA GAC GCG GAC TTC TAT CAG CAG TAT 
Gin Ala Leu Val Met Phe Gin Thr Asp Ala Asp Phe Tyr Gin Gin Tyr 

745 750 755 

GGG CCA GGT GGC ACG TGG CCT GCC GGG CAG GTG CTG CAG GCT GGG GAG 
Gly Pro Gly Gly Thr Trp Pro Ala Gly Gin Val Leu Gin Ala Gly Glu 
760 765 770 

CTG GTC TTC CGC CCT CGC GAC GGG GCT GAG GGC CAG CCC GCA CTG GCA 
Leu val Phe Arg Pro Arg Asp Gly Ala Glu Gly Gin Pro Ala Leu Ala 
775 780 785 

GAG ACC TCC CCT ACA CCT CCT GAA TGT CCC CCG CCT GCC GAG T6AGCTGGCG 
Glu Thr ser Pro Thr Pro Pro Glu Cys Pro Pro Pro Ala Glu 
790 795 800 

GCCCTTCTGA CTGTTTATTT AAGGATGGAT GGCACCCTGG AACCGGGAAG GGTGGCCTGT 



2046 



TCCCTAGAGA GAATAAATTG GATTATTTTC TAAAAAAAAA AA 
(2) INFORMATION ZU SEQ ID NO: 2: 



2094 



2142 



2190 



2238 



2286 



2334 



2382 



2430 



2478 



2526 



2578 



2638 
2680 
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(1) SEQUENZ CKARAKTERISTZKA: 

(A) lAnGE: 803 AmlnosAuren 

(B) ART: Ainlnos&ure 
(D) TOPOLOGIE: linear 

(ii) ART DES MOLEKOlS: Protein 

(xi) SEQUENZBESCHREIBONG: SEQ ID NO: 2: 



Met ASP Plie Pro Gin His Ser Gin His Val Leu Glu Gin Leu Asn Gin 
15 10 " 

Gin Arg Gin Leu Gly Leu Leu Cys Asp Cys Thr Phe Val Val Asp Gly 

20 25 30 

val His Phe Lys Ala His Lys Ala Val Leu Ala Ala Cys Ser Glu Tyr 
35 40 45 

Phe Lys Met Leu Phe Val Asp Gin Lys Asp val Val His Leu Asp He 
SO 50 55 fiO 

Ser Asn Ala Ala Gly Leu Gly Gin Met Leu Glu Phe Met Tyr Thr Ala 
65 70 75 80 

Lys Leu ser Leu Ser Pro Glu Asn Val Asp Asp Val Leu Ala Val Ala 

85 90 55 

Thr Phe Leu Gin Met Gin Asp He He Thr Ala Cys His Ala Leu Lys 

100 105 110 

ser Leu Ala Glu Pro Ala Thr Ser Pro Gly Gly Asn Ala Glu Ala Leu 
115 120 125 

Ala Thr Glu Gly Gly Asp Lys Arg Ala Lys Glu Glu Lys Val Ala Thr 
130 135 1*0 

Thr Leu Ser Arg Leu Glu Gin Ala Gly Arg Ser Thr Pro He Gly 

150 155 IS*' 



Ser 
145 

pro ser Arg Asp Leu Lys Glu Glu Arg Gly Gly Gin Ala Gin Ser Ala 
40 165 170 175 

Ala ser Gly Ala Glu Gin Thr Glu Lys Ala Asp Ala Pro Arg Glu Pro 

180 185 190 

« Pro Pro val Glu Leu Lys Pro Asp Pro Thr Ser Gly Met Ala Ala Ala 

195 200 205 

Glu Ala Glu Ala Ala Leu Ser Glu Ser Ser Glu Gin Glu Met Glu val 
210 215 220 



Glu Pro Ala Arg Lys Gly Glu Glu Glu Gin Lys Glu Gin Glu Glu Gin 
225 230 235 240 
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Glu Glu Glu Gly Ala Gly Pro Ala Glu Val Lys Glu Glu Gly Ser Gin 

245 250 255 

Leu Glu Asn Gly Glu Ala Pro Glu Glu Asn Glu Asn Glu Glu Ser Ala 

260 265 270 

Gly Thr Asp ser Gly Gin Glu Leu Gly Ser Glu Ala Arg Gly Leu Arg 
275 280 285 

Ser Gly Thr Tyr Gly Asp Arg Thr Glu Ser Lys Ala Tyr Gly Ser Val 
290 295 300 

He His Lys Cys Glu Asp Cys Gly Lys Glu Phe Thr His Thr Gly Asn 

315 320 



305 



310 



Phe Lys Arg His He Arg lie His Thr Gly Glu Lys Pro Phe Ser Cys 

325 330 335 

Arg Glu Cys Ser Lys Ala Phe Ser Asp Pro Ala Ala Cys Lys Ala His 

340 345 350 

Glu Lys Thr His Ser Pro Leu Lys Pro Tyr Gly Cys Glu Glu Cys Gly 

360 365 



355 



Lys 



Ser Tyr Arg Leu He Ser Leu Leu Asn Leu His Lys Lys Arg His 



370 



375 



380 



ser Gly Glu Ala Arg Tyr Arg Cys Glu Asp Cys Gly Lys Leu Phe Thr 
385 390 395 400 

Thr ser Gly Asn Leu Lys Arg His Gin Leu val His Ser Gly Glu Lys 

410 415 



405 



Pro 



Tyr Gin Cys Asp Tyr Cys Gly Arg Ser Phe Ser Asp Pro Thr Ser 

425 430 



420 



Lys Met Arg His Leu Glu Thr His Asp Thr Asp Lys Glu His Lys Cys 

440 445 



435 



Pro 



His cys ASP Lys Lys Phe Asn Gin Val Gly Asn Leu Lys Ala His 



450 



455 



460 



Leu Lys lie His He Ala Asp Gly Pro Leu Lys Cys Arg Glu Cys Gly 
465 470 475 480 

Lys Gin Phe Thr Thr Ser Gly Asn Leu Lys Arg Gin Leu Arg He His 



485 



490 



ser Gly Glu Lys Pro Tyr Val Cys He His Cys Gin Arg Gin Phe Ala 

500 505 510 

ASP pro Gly Ala Leu Gin Arg His Val Arg He His Thr Gly Glu Lys 
515 520 525 
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Pro Cys Gin Cys Val Met Cys Gly Lys Ala Phe Thr Gin Ala Ser Ser 
530 535 540 

Leu lie Ala His Val Arg Gin His Thr Gly Glu Lys Pro Tyr Val Cys 
545 550 555 560 

Glu Arg Cys Gly Lys Arg Phe Val Gin Ser Ser Gin Leu Ala Asn His 

565 570 575 

lie Arg His His Asp Asn lie Arg Pro His Lys Cys Ser Val Cys Ser 

580 585 590 



Lys 



Ala Phe Val Asn Val Gly Asp Leu Ser Lys His lie He He His 



595 



600 



605 



Thr Gly Glu Lys Pro Tyr Leu Cys Asp Lys Cys Gly Arg Gly Phe Asn 
610 615 620 

Arg Val Asp Asn Leu Arg Ser His Val Lys Thr Val His Gin Gly Lys 
625 630 635 640 

Ala Gly He Lys He Leu Glu Pro Glu Glu Gly Ser Glu Val Ser Val 

645 650 655 

val Thr val Asp Asp Met Val Thr Leu Ala Thr Glu Ala Leu Ala Ala 

660 665 670 

Thr Ala val Thr Gin Leu Thr val Val Pro Val Gly Ala Ala Val Thr 
675 680 685 

Ala Asp Glu Thr Glu Val Leu Lys Ala Glu He Ser Lys Ala Val Lys 
690 695 700 

Gin val Gin Glu Glu Asp Pro Asn Thr His He Leu Tyr Ala Cys Asp 

715 720 



705 



710 



ser Cys Gly Asp Lys Phe Leu Asp Ala Asn Ser Leu Ala Gin His Val 

725 730 735 

Arg He His Thr Ala Gin Ala Leu Val Met Phe Gin Thr Asp Ala Asp 

740 745 750 

Phe Tyr Gin Gin Tyr Gly Pro Gly Gly Thr Trp Pro Ala Gly Gin Val 
755 760 765 

Leu Gin Ala Gly Glu Leu Val Phe Arg Pro Arg Asp Gly Ala Glu Gly 
770 775 780 

Gin Pro Ala Leu Ala Glu Thr Ser Pro Thr Pro Pro Glu Cys Pro Pro 
785 790 795 800 

Pro Ala Glu 
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PatentansprOche 

1. tsoliertes Protein mit der in SEQ ID N02 dargestellten Aminosduresequenz sowie die daraus durch Substitution. 
Insertion Oder Deletion von einem oder mehreren Aminosdureresten erhditlichen Muteine, die noch die wesentli- 
Chen biologischen Eigenschaften des in SEQ ID N02 dargestelHen Proteins besitzen. 

2. Protein gemdB Anspruch 1 , dadurch gekennzeichnet. daB es sich urn ein humanes Protein handeit. 

3. Nukleinsduresequenz codierend f Qr ein Protein gemdB Anspruch 1 . 

4. Nukleinsduresequenz nach Anspruch 3, dadurch gekennzeichnet, da3 sie fur ein Protein codlert, das mindestens 
95 % kjentitat mrt der in SEQ ID N0:2 dargestellten Sequenz besitzt. 

5. Nukleinsduresequenz nach Anspruch 3. dadurch gekennzeichnet. daB sie die in SEQ ID N0:1 dargestelfte Struktur 
besitzt. 

6. Vektor enthaKend eine Nukleinsduresequenz gemdB Anspruch 3 - 5. funktionell verknQpft mit mindestens einem 
Reguiationselement. 

7. Wirtsorganismus, transfbrmiert mit einer Nukleinsduresequenz nach Anspruch 3. 

8. Wirtsorganismus. transfbrmiert mit einem Vektor gemdB Anspruch 6. 

9. Verlahren zur Herstellung eines Proteins gemdB Anspruch 1 , dadurch gekennzeichnet, daB man einen Wirtsorga- 
nismus gemdB Anspruch 6 unter Bedingungen kultiviert die die Expression des Proteins eriauben und anschlte- 
Bend das exprimierte Protein vom Wirtsorganismus abtr^nt und in reiner Form isoiiert 

10. Verwendung eines Proteins gemdB Anspruch 1 zur kientifizierung von spezrfischen transkriptionsmodulierenden 
Sut)stanzen. 

11. Verfahren zur Identifizierung von spezrfischen transkriptionsmodulierenden Substanzen. das folgende Schritte 
umfaBt: 

(a) Inkubation des Proteins gemdB Anspruch 1 mit dem Genprodukt von myc unter Bedingungen. unter denen 
sich ein Proteinkomplex zwischen diesen beiden Proteinen ausbildet 

(b) Inkubation der beiden Proteine unter ansonst gleichen Bedingungen wie (a) jedoch In Anwesenheit einer 
Oder mehrerer Substanzen, die auf spezifische transkrqstionsmodulierende Aktivitdten zu testen sind, 

(c) ErmittiBin des Unterschiedes in der Proteinkomplexbiidung zwischen (b) und (a), 

(d) Auswahl solc^er Substanzen. bei denen gemdB Schritt (b) eine andere Proteinkomplextxtiung erhalten 
wurde als bei Schritt (a). 

12. Venvendung eines Proteins gemdB Anspruch 1 als Antigen zur Herstellung von spezifischen AntikOrpern. 

13. Verwendung einer Nukleinsduresequenz nach Anspruch 3 zur Gentherapie. 

14. Verwendung einer zu der Sequenz gemdB Anspruch 3 komplementdren Nukleinsduresequenz zur Gentherapie. 

15. Venvendung nach Anspruch 13 oder 14, dadurch gekennzeichnet, daB man durch die exogen zugefQhrte Nuklein- 
sduresequenz die zelluldre Kbnzentration des Proteins gemdB Anspruch 1 erhOht Oder emiedrigt 
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Abstract (Basic) : EP 875567 A 

A protein (SEQ 2) (a defined sequence of 803 amino acids given in 

the specification) is new. 

USE - The organisms can be used to produce the protein (a 
Myc-binding zinc finger protein) . The protein can be used to identify 
transcription-modulating siibstances, in a process comprising: (a) 
incubating the protein with myc gene product under conditions such that 
a complex is formed between the two proteins; (b) repeating (a) in the 
presence of one or more test substances; (c) determining the difference 
in protein complex formation between (a) and (b) ; and (d) selecting 
sxibstances for which the protein complex formation in (b) is different 
from that of (a) . The protein can be used to produce antibodies. The 
nucleic acid sequence can be used for gene therapy. The nucleic acid 
sequence complementary to the above sequence is useful for gene therapy 
(claimed) . 



